草庐IT

c++ - 压缩字符串存储

全部标签

python - 为什么某些正则表达式引擎会在单个输入字符串中匹配 .* 两次?

许多正则表达式引擎在单行字符串中匹配.*两次,例如,在执行基于正则表达式的字符串替换时:根据定义,第一个匹配项是整个(单行)字符串,正如预期的那样。在许多引擎中有第二个匹配项,即空字符串;也就是说,即使第一个匹配项消耗了整个输入字符串,.*仍会再次匹配,然后匹配输入字符串末尾的空字符串。注意:要确保只找到一个匹配项,请使用^.*我的问题是:这种行为有充分的理由吗?一旦输入字符串被完全使用,我不希望再次尝试找到匹配项。除了反复试验之外,您能否从支持的文档/正则表达式方言/标准中收集到哪些引擎表现出这种行为?更新:revo'shelpfulanswer解释当前行为的方式;至于潜在的原因,请

Ruby:模糊测试所有 unicode 字符(UTF8/编码/字符串操作)

我无法遍历整个unicode字符范围。我到处找...我正在构建一个模糊器,并希望将所有unicode字符(一次一个)嵌入到一个url中。例如:http://www.example.com?a=\uff1c我知道有一些内置工具,但我需要更多的灵active。如果我能像下面那样做:"\u"+"ff1c"那就太好了。这是我得到的最接近的:char="\u0000"...#withiniterationchar.succ!...但在字符"\u0039"之后,即数字9,我将得到"10"而不是":" 最佳答案 您可以使用pack将数字转换为UT

Rubyzip 与 native 操作系统压缩

我想知道与使用native操作系统库执行压缩相比,使用ruby​​zip压缩数据时的性能差异是什么。我正在从URL获取要压缩的数据,然后使用ZipOutputStream创建zip文件。对于native操作系统实用程序,我正在考虑使用zip工具。很高兴听到这两种方法的优缺点。 最佳答案 事实证明,无论是运算时间还是CPU使用率,都没有太大差异。但是在内存使用方面存在显着差异。与使用ziputil相比,使用ruby​​zip的过程最终会使用更多的内存。在我们的用例中,内存使用是一个重要问题,因此我们最终使用了zip实用程序。

ruby 和重音字符

下面的文字摘要:如何在Ruby中显示重音字符(以便它们通过puts等工作)?您好!我正在为我的类(class)编写一个程序,它将用西类牙语显示一些句子。当我尝试在Ruby中使用重音字符时,它们无法正确显示(在NetBeans输出窗口(在Java中可以正常显示重音字符)或在命令提示符中)。起初,我的一些代码甚至没有运行,因为我的数组中的重音字符抛出了Ruby中断器(我猜?)。我遇到错误,例如Ruby需要一个右括号。但我做了一些研究,找到了一个解决方案,将以下代码行添加到我的Ruby文件的开头:#编码:utf-8在NetBeans中,我的程序运行与这一行无关。但我需要添加这一行才能让我的程

ruby - 如何使用 ruby​​zip 解压缩压缩文件夹

我知道如何使用ruby​​zip检索普通zip文件的内容。但是我在解压缩压缩文件夹的内容时遇到了问题,我希望你们中的任何人都能帮助我。这是我用来解压的代码:Zip::ZipFile::open(@file_location)do|zip|zip.eachdo|entry|nextifentry.name=~/__MACOSX/orentry.name=~/\.DS_Store/or!entry.file?logger.debug"#{entry.name}"@data=File.new("#{Rails.root.to_s}/tmp/#{entry.name}")endendentry

ruby - 如何制作 Ruby 1.8 小写非拉丁字符?

我正在使用Ruby1.8。似乎downcase不会改变非拉丁字符。例如:"Δ".downcase返回“Δ”我知道在Ruby1.9.1及更高版本中,我可以使用UnicodeUtils(fromhere)。我试过了,它工作正常。返回上一个示例的"δ"。是否有适用于1.8Ruby的等效(或任何)解决方案? 最佳答案 nash@nash:~$ruby-vruby1.8.7(2011-02-18patchlevel334)[i686-linux]gem安装unicode(https://rubygems.org/gems/unicode)re

ruby - 错误的参数类型字符串(应为数组)

我正在尝试使用Octopress(Jekyll之上的博客引擎)在我的新Macbook上,当我运行bundleexecjekyll--server时出现此错误:(缩短路径)/path/to/markdown.rb:118:in`to_html':wrongargumenttypeString(expectedArray)(TypeError)from/path/to/markdown.rb:118:in`convert'...(完整路径)/usr/local/rvm/gems/ruby-1.9.2-p290/gems/jekyll-0.11.0/lib/jekyll/converters

ruby-on-rails - 如何使 Rails 3 JSON 解析双引号字符串和单个数字

背景关于json.org网站,字符串定义为"char+",其中char+是一个或多个char。char是除"或\之外的任何unicode字符。控制字符的子集是允许的,只需将它们转义即可:“foo”“2”“\\”在Javascript中,如果要解析一个字符串,需要将其括起来:"\"foo\""或'"foo"',但不是"'foo'"在Rails3中,JSONgem默认运行C或纯Ruby代码。根据接受的答案,gem解析JSON文档而不是元素。文档是键、值(对象/哈希)或值(数组)形式的集合。问题字符串假设我们要解析字符串foo,我们需要将其括为"\"foo\""或'"foo"'JSON.pa

ruby - gem 应该在哪里存储日志文件?

我正在构建一个应该输出日志文件的ruby​​gem。将日志文件存储在哪里是一个好习惯?我正在从我正在构建的Rails网站中提取此功能,我可以在那里简单地登录到log/目录。 最佳答案 理想情况下,使路径可配置(.rc文件、交换机、rails/rack配置等)。如果它是一个Rack中间件,添加在构造函数的参数中指定它的可能性。如果没有提供日志路径,回退到检测日志目录。(我依稀记得它是Rails中的config.paths['log'],但如果可以的话,请确保config在你的gem中使用之前确实指向某些东西在Rails之外使用。)如果

ruby-on-rails - 在 ruby​​ 进程之间处理大数据对象

如果使用Marshal.dump写入文件,我有一个Ruby散列达到大约10兆字节。gzip压缩后约为500KB。在ruby​​中迭代和改变这个散列是非常快的(几分之一毫秒)。即使复制它也非常快。问题是我需要在RubyonRails进程之间共享此散列中的数据。为了使用Rails缓存(file_store或memcached)执行此操作,我需要先Marshal.dump文件,但这会在序列化文件时产生1000毫秒的延迟,在序列化文件时产生400毫秒的延迟。理想情况下,我希望能够在100毫秒内从每个进程保存和加载此哈希。一个想法是生成一个新的Ruby进程来保存这个散列,该散列为其他进程提供AP